健康信息学正以前所未有的速度重塑现代医疗,它不再仅仅是电子病历的数字化,而是利用数据科学挖掘海量健康信息,以优化诊疗决策、提升公共卫生响应效率。这一领域架起了临床医学与计算技术之间的桥梁,让原本沉睡的数据转化为挽救生命的洞察。

在 Gist.Science,我们专注于从 medRxiv 预印本服务器中实时追踪该领域的最新研究。我们处理每一份新发布的论文,不仅提供详尽的技术解读,更将其核心发现转化为通俗易懂的中文摘要,确保无论是专业人士还是普通公众都能轻松理解这些前沿突破。

以下为您呈现健康信息学领域的最新论文列表,带您第一时间探索数据驱动医疗的未来。

The Risk Factors, Detection and Classification of Esophageal Cancer Using Ensemble Machine Learning Models

该研究提出了一种基于多种子集成策略和随机森林特征排序的机器学习框架,利用埃塞俄比亚阿西地区人群的饮食、环境及临床等多维风险因素,成功构建了高性能的食管癌分类模型,其中直方图梯度提升模型在精简特征集上实现了 98.3% 的准确率及零假阴性检测,为资源受限地区的早期诊断与风险分层提供了可靠且可解释的决策支持工具。

Gaso, M. S., Mekuria, R. R., Cankurt, S., Deybasso, H. A., Abdo, A. A., Abbas, G. H.2026-03-11📄 health informatics

Co-designing a virtual reality based mindfulness application to address diabetes distress using Artificial Intelligence-informed Experience-Based Co-Design (AI-EBCD): a feasibility study

本研究通过人工智能辅助的体验式共同设计(AI-EBCD)方法,与 2 型糖尿病患者及正念从业者合作,探索并确定了针对糖尿病痛苦定制的虚拟现实正念应用的设计特征与功能,以期为后续开发原型及开展更广泛研究奠定基础。

Ghosal, S., Zhang, M., Stanmore, E., Sturt, J., Bogosian, A., Woodcock, D., Milne, N., Mubita, W., Robert, G., O'Connor, S.2026-03-11📄 health informatics

Regression vs. Medical LLMs: A Comprehensive Study for CVD and Mortality Risk Prediction

本研究基于 LURIC 队列数据,系统比较了传统回归模型与医疗大语言模型(MedLLMs)在心血管疾病及死亡率预测中的表现,发现经优化的 MedLLMs 性能可媲美甚至超越传统方法,且通过 Platt 缩放等校准技术能有效解决其系统性高估风险的问题。

KOM SANDE, S. D., Skorski, M., Theobald, M., Schneider, J., Marz, W.2026-03-11📄 health informatics

Variability in Automated Sepsis Case Detection: A Systematic Analysis of Implementation Methods in Clinical Data Repositories

该研究通过系统综述发现,尽管使用相同的 MIMIC-III 和 eICU-CRD 数据集,不同研究在脓毒症病例检测的方法学异质性(如 SOFA 评分计算、时间窗口及感染判定等)导致了检测率的巨大差异,因此呼吁标准化报告检测方法及公开版本控制的源代码以提升研究的可重复性。

Meyer-Eschenbach, F., Schmiedler, R., Stoephasius, J. v., Zhang, C., Kronfli, L., Frey, N., Naeher, A.-F., Ehret, J., Nothacker, J., Kalle, C. v., Kohler, S., Gruenewald, E., Edel, A., Kumpf, O., Barr (…)2026-03-10📄 health informatics

Time-to-event modeling with multimodal clinical and genetic features improves risk stratification of liver complications in chronic hepatitis C

该研究利用“全人类”计划的多模态临床与遗传数据,构建并验证了一个可解释的生存分析框架,通过整合人口学、实验室指标、社会经济因素及遗传变异等特征,显著提升了慢性丙型肝炎患者发生肝硬化、肝细胞癌及死亡风险的个体化分层能力。

Islam, H., Arian, A., Franses, J. W., Ahsan, H.2026-03-09📄 health informatics

Predictors of COVID-19 hospital outcomes: a machine learning analysis of the National COVID Cohort Collaborative

该研究利用美国国家 COVID 队列协作(N3C)的 26 万余例住院患者数据,通过多种机器学习模型分析发现,尽管常规结构化电子病历特征对预测住院死亡率具有中等区分度,但难以有效预测住院时长,且过采样技术(SMOTE)在提升召回率的同时会牺牲模型的区分度与校准性,提示临床机器学习研究需综合报告阈值相关指标以优化风险分层。

Vazquez, J., Taylor, L., Chen, Y.-Y. K., Araya, K., Farnsworth, M. G., Xue, X., Hasan, M., N3C Consortium,2026-03-09📄 health informatics

A Novel Blended Hybrid Care Model for Maternal Mental Health: Cohort Study of Pregnant and Postpartum Patients

这项研究评估了一种结合同步远程医疗与异步移动应用(mindLAMP)的混合护理模式(Digital Clinic),结果显示该模式能显著降低围产期女性的抑郁和焦虑症状,证明了其在提供可及且有效的循证母婴心理健康护理方面的潜力。

Calvert, E. I., Chen, K., Moon, K., Emerson, M. R., Feldman, N., Lager, C., Torous, J.2026-03-09📄 health informatics

Population differences in wearable device wear time: Rescuing data to address biases and advance health equity

该研究利用"All of Us"项目中的 Fitbit 数据,首次系统揭示了人口学、社会经济及心理健康等因素对可穿戴设备佩戴时长的显著影响,指出传统合规阈值会加剧疾病人群的数据偏差,并据此提出了一套包含动态阈值与统计校正在内的灵活框架,以优化数据保留并推动数字健康研究的公平性。

Hurwitz, E., Connelly, E., Sklerov, M., Master, H., Hochheiser, H., Butzin-Dozier, Z., Dunn, J., Haendel, M. A.2026-03-06📄 health informatics